Java CLI 解析器

python - 为什么python XML解析速度不一致？

我正在解析一个大的(12GB)XML文件，该文件由大约135k或多或少的相似记录组成(这是一个nmap转储)。我注意到解析速度不一致，解析相似记录的时间变化很大。以下按比例缩小的代码输出解析每1%的记录所需的时间:fromxml.etree.ElementTreeimportiterparseimporttimenrhosts=0previous=time.time()context=iterparse("test.xml",events=("start","end"))context=iter(context)event,root=context.next()forevent,ele

python XML section 的 code performance parsing

javascript - 使用 Javascript 解析 XML(在 Google Scripts 中)

我有温度传感器流式传输三个hive的温度，并希望能够解析XML流以提供传感器的最后一个值。我想要:传感器1:75度(更新时间:晚上9:04)传感器2:75度(更新时间:晚上9:04)等我在GoogleScripts中运行以下脚本，但不断收到错误消息:CannotfindfunctiongetContentTextinobject这是一个简单的脚本:functionXMLing(){varresponse=UrlFetchApp.fetch("https://api.cosm.com/v2/feeds/79697.xml?key=[privatekeyhere]");vardoc=Xml

javascript 34 value section xml parsing google-apps-script

objective-c - 如何使用 NSXMLParser 解析内部声明的 XML 实体引用

我有一个使用内部声明实体的XML文件。例如:......foo&my_symbol;bar...使用NSXMLParser类，我如何能够解析my_symbol实体引用？根据实验，parser:foundInternalEntityDeclarationWithName:value:将为my_symbol调用委托(delegate)方法实体声明，有值"mysymbolvalue".然后，当my_next_element达到元素，NSXMLParser将调用parser:didStartElement:namespaceURI:qualifiedName:attributes:委托(del

objective-c NSXMLParser parser NSString code xml iphone cocoa

node.js - 在 node.js 中解析大型 xml 文件(1G+)

我很难找到可以解析1G+大小的大型xml文件的Node包。我们的后端服务器主要是node.js，所以我不想用另一种语言/平台构建另一个服务来解析xml并将数据写入数据库。有没有人在Node中成功地做过这种事情？你用什么？我看过很多包，如xml-stream、big-xml等，它们都有自己的问题。有些甚至不能在mac上编译(而且看起来已经过时并且不再受支持)。我真的不需要将解析的结果转换成js对象或类似的东西。只需要理解数据，然后写入数据库。最佳答案最明显但不是很有帮助的答案是，这取决于要求。然而，在您的情况下，这似乎非常简单；您

node 大型 noreferrer noopener nofollow node.js xml xml-parsing filestream

.net - 解析具有未定义实体的 XHTML 文档

在使用Python编码时，如果我必须加载带有未定义实体的XHTML文档，我会创建一个解析器并更新实体字典(即nbsp):importxml.etree.ElementTreeasETparser=ET.XMLParser()parser.entity['nbsp']=' 'tree=ET.parse(opener.open(url),parser=parser)我尝试使用VB.Net将XHTML文档解析为LinqXDocument:DimxAsXDocument=XDocument.Load(url)引发了XmlException:Referencetoundeclare

未定 XHTML code string nextEntity .net xml vb.net

r - 在 R : Incorrect namespaces 中解析 XML

我有一堆XML文件和一个将文件内容读入数据框的R脚本。但是，我现在得到了我想像往常一样解析的文件，但是它们的命名空间定义中有些东西不允许我使用XPath表达式正常选择它们的值。XML文件是这样的:xml_nons.xmlName1Title12015还有一个:xml_ns.xmlName2Title22014xmlns指向的URL不存在我用的R代码是这样的:library(XML)xmlfiles但是，我得到的结果是:FilenameNameTitleDate./xml_nons.xmlName1Title12015如果我从第二个文件中删除命名空间链接，我会得到正确的结果:Filena

namespaces Incorrect lt 34 code r xml xml-namespaces xml2

.net - 使用 XLINQ 解析 XHTML 文件的库

当我意识到我需要为大约50个XHTML页面创建一个索引，这些页面可能会在将来被添加/删除/重命名/移动时，我想“没问题——我将使用LINQ编写一个快速索引生成器来XML，因为XHTML绝对算作XML”。当然，当我尝试运行它时，我发现了XLINQ在像这样的XHTML实体上阻塞的事实。我使用以下算法解决了这个问题:将XHTML文件读入字符串。对该字符串使用正则表达式搜索和替换，将一个部分添加到定义所有相关实体的DOCTYPE中(因为我只关心我读取的文件中的“title”属性，而我的输出文件现在不使用任何实体，它只是将它们全部设置为空白，但我稍后可能会添加实际值)。将结果解析为XDocum

XLINQ XHTML section li .net xml linq linq-to-xml

.net - 在 .net 中解析 xml 的正则表达式

我使用以下函数从我的xmlString中删除字符\04和nulls但我找不到我需要更改的内容避免从我的结束标记中删除\。这是我运行这个函数时得到的结果20080625201106066267831FALSEFALSE任何人都可以帮我找出我需要改变我的表达什么来保持结束标记为PrivateFunctionCleanInput(ByValinputXMLAsString)AsString'Note-ThiswillperformbetterifyoucompiletheRegexanduseareferencetoit.'Thatassumesitwillstillbememory-res

net xml code section strong .net regex vb.net

python - SAX 解析器如何处理字符？

我写了一些代码来解析一个XML文件，并想打印它的字符，但每个字符似乎都调用了characters()回调函数3次。代码:defcharacters(self,chrs):ifself.flag==1:self.outfile.write(chrs+'\n')xml文件:9308865输出如下，有很多空行。9308865我觉得应该是:9308865为什么会有空格行？我阅读了文档信息:characters(self,content)Receivenotificationofcharacterdata.TheParserwillcallthismethodtoreporteachchunko

何处 python code section pre xml

xml - 如何将相关系统 DTD 加载到 StAX 解析器中？

我正在使用woodstox为XML文件实现StAX解析器。假设我在文件系统的公共(public)目录中某处有一个有效的XML文件和匹配的DTD。/path/to/test.xml/path/to/test.dtd使用相对系统标识符声明的XML引用其DTD，如下所示:从验证的角度来看，我觉得一切都很好。(是吗？xmllint没有提示。)但是，当我试图用下面的代码解析文件时，woodstox抛出一个java.io.FileNotFoundException，因为它找不到相关的DTD文件。在我看来，该实现试图访问相对于工作目录而不是相对于XML文件对象的DTD文件。importjava.io

StAX xml code section noreferrer dtd woodstox

163 164 165166167 168 169